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Резюме 


Введение. Большие объемы научных данных и развитие парадигмы 
Рафа-Оиуеп 5‹епсе формируют потребность в принципиально новых 
инструментах для работы с информацией и научных коммуникаций. 
Появление таких инструментов возможно только при наличии техно- 
логического фундамента — развитой цифровой инфраструктуры для 
хранения и обмена большого разнообразия научных данных, ориен- 
тированной на использование не только исследователями, но и про- 
граммными агентами. В статье анализируются проблемы сложившихся 
в России практик управления научной информацией и существующих 
барьеров, которые препятствуют созданию инструментов нового поко- 
ления. Их преодоление является очень сложной и масштабной задачей, 
что обусловлено разнообразием акторов научно-информационной 
деятельности и видов научной информации, спецификой различных 
предметных областей и другими факторами. Для ее решения необхо- 
дима Стратегия развития Национальной научно-информационной ин- 
фраструктуры — комплекс системных изменений стандартов и практик 
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работы с научной информацией, затрагивающих значительную часть 
научного сообщества. Результаты и дискуссия. Сформулированы ос- 
новные положения Стратегии, включая цель, задачи и принципы раз- 
работки, ее основная миссия (создание среды для формирования це- 
почек приращения ценности научной информации). Заключение. Ре- 
зультатом реализации предложенной Стратегии должны стать новые 
высокоинтеллектуальные сервисы для информационной поддержки 
различных видов научной деятельности; развитие цифровых компе- 
тенций исследователей; значительное увеличение интенсивности ис- 
пользования научного контента; развитие рынка научно-информаци- 
онных услуг; улучшения в системе разделения научного труда. 


Ключевые слова: наука о данных, научная информация, научно-техни- 
ческая информация, онтология, метаданные, научная коммуникация 
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Введение / ПигодисНоп 


Уровень научно-технического развития страны определяет ее 
способность отвечать на большие вызовы, потенциал экономиче- 
ского развития и конкурентность на мировых рынках. Он зависит 
от целого ряда факторов, в т. ч. от системы организации исследо- 
вательской деятельности, развитости научной инфраструктуры, 
средств производства знания. 

Научно-информационная инфраструктура' является одним из 
критически важных элементов, существенно влияющим на уровень 


` Здесь и далее под научно-информационной инфраструктурой мы будем пони- 
мать совокупность объектов, которые предоставляют исследовательскому сообще- 
ству ресурсы и услуги, связанные с поиском, сбором, изучением, обработкой, анали- 
зом, синтезом и распространением научной информации. К таким объектам прежде 
всего относятся организации различных форм собственности, а также каталоги, базы 
данных, информационные системы и сервисы различной принадлежности. 
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научно-технологического развития страны, поскольку она выпол- 
няет функции сохранения и распространения знаний в научном со- 
обществе, пронизывая все дисциплины и этапы жизненного цикла 
исследований. Так, этапы поиска, сбора и обработки научно-техни- 
ческой информации во многом определяют постановку задачи, пла- 
нирование исследования и, следовательно ‚, ценность и значимость 
его результатов. Пренебрежение этим этапом приводит к использо- 
ванию устаревших методов, работе за границами актуальной науч- 
ной повестки, дублированию одних и тех же исследований и другим 
последствиям низкопродуктивной научной деятельности. 

По данным разных исследований, работа с научной информаци- 
ей (ее поиск, сбор, изучение, обработка, анализ, синтез, подготовка 
к публикации и распространение) была и остается одним из наибо- 
лее трудоемких элементов в системе разделения труда исследовате- 
лей. По некоторым оценкам только чтение научных статей занимает 
не менее 10 % времени исследователей, и этот показатель продол- 
жает расти [1]. Многие ученые признают, что вынуждены тратить 
все больше времени на поиск и изучение научной литературы>?. При 
этом некоторые информационные специалисты считают, что многие 
исследователи уже достигли того максимального лимита времени, 
которое они могли бы выделять на чтение статей [2]. Это говорит 
о том, что сложившиеся методы работы с научной информацией 
становятся «бутылочным горлышком» — принципиальным ограни- 
чителем эффективности исследовательской деятельности. На фоне 
быстрого роста объемов знаний, которые уже распространяются не 
только в формате традиционных публикаций, но и в виде разноо- 
бразных массивов данных, это ограничение уже стало критическим. 

Кроме того, следует отметить, что современная наука уже не мо- 
жет базироваться на повестке, сформированной исключительно на 
основе данных из научных статей. Современные реалии требуют 
концентрации внимания ученых на технологических, предпринима- 
тельских, социальных и других аспектах проводимых исследований, 
т.е. в общий пул научно-технической информации активно вовле- 
каются данные из патентов, аналитических отчетов, экономических 
прогнозов и т. д.; становится все более весомой и ценной междисци- 
плинарная составляющая. 

Таким образом, современная культура исследовательской дея- 
тельности, основанная на необходимости обработки больших объ- 
емов данных, требует новых инструментов работы с информацией, 
а также специально организованной научно-информационной ин- 
фраструктуры, где эти инструменты могут функционировать. 

Цель настоящей работы заключается в анализе современных тен- 
денций развития научно-информационной инфраструктуры, а также 
в поиске возможных векторов ее развития с учетом появления все 
больших объемов информации и научных данных, несоразмерных 
возможностям ее обработки стандартными методами и усложняющих 
постановку актуальной научно-технической повестки исследований. 


2 Нетта М. Зп\-т $с‹епИз{5 аге брепата Моге Тите оп Везеагсй Рарег$ // Мафиге 
паех. 2020. АуаЙаЫе а*: ВИрз://\мимим. пабигетаех.сот/пем/5-Бод/5 Пи -т-5сеп${$-аге- 
зрепата-тоге-Ите-оп-гезеагсв-рарег$ (ассез5$еа: 07.07.2022). 
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Результаты и дискуссия / ВезиК$ апа О215си$$юп 


Парадигма Ра*а-Оиуеп $сепсе 

В последние 20 лет развитие научно-информационной инфра- 
структуры в мире шло очень интенсивно, в результате чего сфор- 
мировался новый рынок ресурсов и сервисов для научных ком- 
муникаций и управления научной информацией на разных этапах 
жизненного цикла исследований. Исследовательские группы выби- 
рают подходящую комбинацию инструментов, на основании которых 
организуют свою научную деятельность, а крупные компании, такие 
как Е!5емег и Зрипадег, стремясь увеличить число своих клиентов, 
разрабатывают целые экосистемы связанных между собой серви- 
сов, внедряя их в мировую научно-информационную инфраструкту- 
ру. Количество таких инструментов уже исчисляется сотнями, а для 
их систематизации создаются специальные навигаторы (рис. 1). 

Причиной резкого роста количества таких инструментов явля- 
ется повсеместное развитие новой парадигмы исследовательской 
деятельности Раёа-Оиуеп $с!епсе, основанной на сборе, обработке 
и использовании данных из различных источников?. Это не новая на- 
учная дисциплина, а особый междисциплинарный подход, который 
существенно меняет содержание исследовательской деятельности 
во всех без исключения научных направлениях. 

Текущая четвертая парадигма в науке отличается от трех пре- 
дыдущих тем, что в ней объединяются эксперимент, теория и моде- 
лирование“. До нового времени существовала экспериментальная 
наука, в основе которой лежали наблюдения и эксперименты с си- 
стематизацией и обобщением их результатов. С ХУ\УП в. начинается 
2-й этап — развитие теоретической науки, предполагающей исполь- 
зование теоретических моделей и строгое доказательство научных 
законов. Появление компьютеров в середине ХХ в. дало старт тре- 
тьей парадигме науки — науке вычислительной, основанной на мето- 
дах численного моделирования. «Четвертая парадигма обеспечивает 
интегрирующую структуру, которая позволяет первым трем взаи- 
модействовать и усиливать друг друга»?. Она не просто расширяет 
объем данных для вычислительных моделей третьей парадигмы, но 
и возвращает в фокус внимания главный модус работы второй пара- 
дигмы — теоретическую работу. Раёа-Ри\еп $с!епсе — это не просто 
работы с большим, чем раньше, количеством данных. Это еще и ра- 
бота на стыке и поверх множества дисциплин, относящихся к раз- 
ным типам науки, — например, в междисциплинарном пространстве 
гуманитарных, естественных и социальных наук. Это означает, что 
теоретическая, или, шире, онтологическая работа вновь становится 
ключевой деятельностью ученого. Сложность этой работы в четвер- 
той парадигме значительно превосходит сложность теоретической 


$ Тре Рочий Рага «ат: Ра{а-!и{епя ме 5$<епсе П|!зсоуегу / еч. Бу Т. Неу, $. Тапеу, 
К. Тойе. Кеатопа, М/азПто*оп: М!сгозоЁ КВезеагсй, 2009. 254 р. 

4 Та Бу Уит Сгау {о бе МВС-С$ТВ ш Моитмашт Мем,, СА, оп Уапиагу 11, 2007. Ауа!- 
аЫе а+: ПЕр://йтогау.ахигемебЦКе$.пе{/лтогау{аК$.Пт (ассеззес: 07.07.2022). 

5 СШога А. Гупсй. Уим Сгау'$ ЕочийЙ Рага от апа {Пе Соп$гисНоп оф {Ве $<епй!- 
1с Весога. т: Тве Рочий Рага фот: Ра{а-ш{епме ЗсепИЯс О!5соуегу / еа. Бу Т. Неу, 
5. Тап$!еу, К. То|е. Ретопа, М/А: Мсгозой ВезеагсВ, 2009. Р. 177—183. 
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Рис. 1. Наиболее известные инновационные инструменты для научных 
коммуникаций, распределенные по времени и этапам жизненного цикла 
исследований 


Ро. 1. ТВе тоз${ ме!-Кпомт 1001$ ог $еп!Яс соттитсаНоп, 41${иЮщеа Бу 
{те апа ${адез т Ле Ше сус!е оЁ гезеагсН 


Источник / Зоигсе: ппоуаНоп$ ш $спо!айу СогплтипсаНоп. АуаЙйаЫе а*: 
БЕр5://1О1тпоуаНоп$ ммогарге$$.сот/рге$5/ (ассеззес: 07.07.2022). 


работы второй парадигмы, а объемы данных и сложность вычисли- 
тельных моделей могут уже на порядок превышать привычные для 
третьей, вычислительной парадигмы науки. 

Важно отметить, что в исследовательской деятельности проис- 
ходит еще один фундаментальный сдвиг — трансформация системы 
разделения научного труда. Так, в третьей парадигме сформирова- 
лись новые позиции, т. н. «синие воротнички в науке» — специалисты, 
чья деятельность предполагает хранение, использование и обработ- 
ку информации. В четвертой парадигме их частично будут замещать 
новые позиции — «воротнички цифровые» или «цифровые помощ- 
ники», функции которых лежат в области функций поиска, сбора 
и анализа научной информации. Это расширит возможности иссле- 
дователя не только в сфере работы с вычислительными моделями 
в ситуации порядкового роста количества данных, но и оснастит 
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его инструментами синтеза данных разного качества и построенных 
в разных дисциплинарных логиках и различными разметками дан- 
ных, т. е. в разных дисциплинарных онтологияхе6. 

Можно даже сказать, что этот тип инструментов неминуемо обре- 
тает функции агентности — находясь в коммуникации и взаимодей- 
ствии с исследователем, программный агент парадигмы Ра*а-ОРиуеп 
5сепсе будет вынужден демонстрировать элементы самостоятель- 
ности в собственной активности, осуществлять проактивный выбор 
синтетических меж- и трансдисциплинарных моделей, а его вза- 
имодействие с исследователем повысит качество коммуникации 
и диалога, а не будет просто выполнением его команд. Фактически 
цифровой помощник все больше становится тем, кто вместо иссле- 
дователя обрабатывает массивы информации, «читает» сотни и ты- 
сячи публикаций, фокусируя внимание на выделенных им наиболее 
значимых моделях-гипотезах подобно тому, как раньше это делали 
эксперты институтов научной информации. 

Принципиально важно отметить, что агент такого рода не просто 
осуществляет поиск «подходящих» данных и экспериментальных ди- 
зайнов в рамках одной дисциплинарной модели. Работая с представ- 
ленными в метаданных теоретическими конструктами, он осущест- 
вляет трансдисциплинарный поиск и синтез новых гипотез, указывая 
на скрытое подобие в онтологических конструкциях разных дисци- 
плин. Цифровой агент может предложить перенос и достройку эле- 
ментов этих конструкций из одной дисциплины в другую, а также он- 
тологические основания, способные объединять результаты работы 
исследователей из разных дисциплин. Примером такой работы, осу- 
ществляемой сегодня вручную, являются онтологии, воплощенные 
в платформенные и сетевые научно-исследовательские сервисы: ге- 
номный браузер, лингвистическая платформа Ипауодос и др. 

Программные агенты выполняют рутинные действия с данными 
быстрее людей, однако гораздо хуже «настраиваются» на различные 
формы их представления. Поэтому их появление формирует новые 
требования к научно-информационной инфраструктуре: 

— доступность качественной метаинформации о научных ре- 
зультатах; 

— унификация форматов и протоколов обмена данными; 

— формализация предметных областей. 

Очевидно, что полная унификация форматов и протоколов дан- 
ных является недостижимой целью, а требуемая для этого унифи- 
кация онтологических оснований различных дисциплин принци- 
пиально невозможна (согласно второй теореме Геделя). Однако 
обеспечение автоматизированного доступа программным агентам 
к метаданным результатов научной деятельности потребует унифи- 
кации и перевода в машиночитаемый вид методологических элемен- 
тов этих результатов — экспериментальных планов, теоретических 
оснований, используемой рабочей онтологии и т. д. 

Поддержка этих требований значительно повышает видимость 
результатов научных исследований и обеспечивает возможность 


6 Под онтологией в этой статье мы будем понимать формальное описание некото- 
рой области знаний, которое, как правило, содержит все релевантные классы объек- 
тов, связи между ними и правила, принятые в этой области. 
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создания нового поколения сервисов обработки научной информа- 
ции, основанных на анализе больших данных методами искусственно- 
го интеллекта. Их невыполнение сохраняет принципиальные барьеры 
развитию Раёа-Оиуеп 5<епсе, ограничивает производительность тру- 
да исследователей и снижает конкурентоспособность отечественной 
науки в мире, где уже совершается переход к четвертой парадигме. 


Проблемы российской научно-информационной инфраструктуры 

Проблема несоразмерности объема научной информации возмож- 
ностям человека появилась еще в прошлом веке, когда счет издавае- 
мых журналов пошел на сотни и тысячи. Ответом на этот вызов стало 
создание специализированных организаций — институтов научной 
информации (ВИНИТИ и ИНИОН в СССР, 15| в США), основными зада- 
чами которых были сбор и хранение научных материалов, полученных 
из разных стран мира, а также создание реферативных журналов, по- 
средством которых можно было бегло ознакомиться с результатами 
последних научных исследований. Следует отметить различную судь- 
бу этих организаций в 1990-х гг.: пока российские институты вместе 
со страной переживали глубокий кризис, американский 1$| со своим 
продуктом \М/еЬ оЁ $сепсе стал мировым лидером в области библио- 
графических баз данных, перейдя на предоставление услуг в форма- 
те онлайн. С тех пор и до настоящего времени его основной продукт 
является одним из ключевых элементов научно-информационной ин- 
фраструктуры многих государств и мировой науки в целом. 

Отметим, что вопросы развития научно-информационной инфра- 
структуры обычно являются одним из приоритетов государствен- 
ной научной политики. Например, в Европейском союзе создали 
специализированную правовую форму, которая называется Евро- 
пейский консорциум научной инфраструктуры (Ечгореап КезеагсВ 
|пРгаз{гисиге Сопзог иг). В рамках этих консорциумов реализуются 
различные проекты [3], за счет которых развитие европейской науч- 
но-информационной инфраструктуры идет очень интенсивно. 

По ряду причин научно-информационная инфраструктура в Рос- 
сии на настоящий момент слабо ориентирована на поддержку ис- 
следований в парадигме Вафа-Оиуеп 5сепсе. Созданный в 1970-х гг. 
мощный задел в виде Государственной системы научно-технической 
информации (ГСНТИ) давно утрачен, а существующая инфраструк- 
тура с 1990-х гг. формировалась стихийно, практически без цен- 
трализованных решений. Попытки их создания предпринимались 
в институтах РАН”, однако они не получили широкого распростра- 
нения (исключениями являются Российский индекс научного цити- 
рования (далее — РИНЦ) и несколько нишевых проектов, таких как 
Мими. гпа{Ппе*.ги). Значительную роль в этом сыграли недостаточное 
финансирование (до 2012 г. научной сфере в целом не уделялось 
должного внимания, и в частности — вопросам управления научной 
информацией) и отсутствие систематической реализации программ- 
ного подхода к проблеме (стратегические программы не разраба- 
тывались и не реализовывались). Это привело к т. н. «лоскутной 


7 Кулагин М. В., В. А. Серебряков. Информационное пространство РАН (Проекты 
и реализация, 1998—2013) // Тр. ХМШ Всерос. науч. конф. Новороссийск, 19—24 сентября 
2016 г. Новороссийск: Ин-т приклад. математики им. М. В. Келдыша РАН, 2016. С. 194—221. 
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автоматизации» в масштабах страны — разработке отдельных реше- 
ний (чаще государственных и реже коммерческих), слабо пригод- 
ных для взаимной интеграции и для формирования эффективной 
системы распространения знаний, как среди российских ученых, так 
и их интеграции в мировую науку. Не были сформулированы единые 
принципы и не была разработана (или хотя бы заимствована) единая 
модель целевого состояния системы научно-технической информа- 
ции. Будь это сделано, принцип обеспечения машиночитаемости 
научно-технических данных программными агентами и соответству- 
ющая этой практике нормативная база были бы сформулированы 
в качестве первых требований. 

Деятельность институтов научной информации и научных би- 
блиотек атомизирована, их программы развития никак не связаны 
между собой, а нередко просто отсутствуют. Ситуация усугубляется 
из-за неразвитого национального рынка научно-информационных 
продуктов и, как следствие, высокой зависимости от информацион- 
ных ресурсов иностранного производства. 

На государственном уровне обсуждалось создание централизо- 
ванного решения — Единого российского электронного простран- 
ства знаний, упомянутого в Федеральном законе «О библиотечном 
деле» (ред. от 03.07.2016). Однако этот проект пока не реализо- 
ван, и более того, его концепция также не утверждена. По нашему 
мнению, основным препятствием для его использования в научной 
сфере является ведомственная принадлежность. В подзаконных 
актах сказано, что «Пространство знаний формируется Министер- 
ством культуры Российской Федерации на технологической осно- 
ве Национальной электронной библиотеки»8, тогда как большин- 
ство поставщиков и потребителей научной информации относятся 
к Минобрнауки России, а также к другим ведомствам и госкорпора- 
циям, занимающимся исследованиями и разработками. Это создает 
высокие риски, что такая система будет ориентирована, в первую 
очередь, на сохранение исторического и культурного достояния на- 
родов России, а обсуждаемые здесь проблемы научно-информаци- 
онной инфраструктуры так и не будут решены. 

Вопросам развития Национальной научно-информационной ин- 
фраструктуры не уделялось должного внимания еще и из-за того, 
что существует иллюзия доступности научной информации. Она за- 
ключается в том, что для опытного исследователя не составит труда 
найти нужную публикацию в одном из многих возможных каналов: 
РИНЦ, лицензионная подписка организации, университетские архи- 
вы, репозитории препринтов, научные социальные сети, обращения 
к коллегам из других организаций, разные виды открытого досту- 
па. Иллюзорность такой доступности состоит в том, что этот подход 
нельзя «поставить на поток», алгоритмизировать и запрограммиро- 
вать. Это создает непреодолимый барьер для активного включения 
в научную коммуникацию программных агентов и принципиаль- 
но ограничивает переход к следующей парадигме науки в стране, 


8 Постановление Правительства РФ от 20.02.2019 № 169 «Об утверждении Поло- 
жения о федеральной государственной информационной системе “Национальная 
электронная библиотека” и методики отбора объектов Национальной электронной 
библиотеки» // СПС «КонсультантПлюс». 
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создавая потолок продуктивности ’научно-исследовательского 
и технолого-производственного комплексов страны. 

Поэтому перечисленные ниже проблемы мы рассматриваем с по- 
зиции архитектора информационных программных систем, задачей 
которого является выстраивание архитектуры интенсивного инфор- 
мационного обмена, цепочек обработки, сопоставления, системати- 
зации и анализа данных с целью увеличения их информационной 
ценности в рамках парадигмы Ра*а-Виуеп $<епсе. 

1. Недоступность или низкое качество метаданных?. Метаданные 
публикаций являются базовым информационным элементом любой 
информационной системы. Их плохое качество снижает функцио- 
нальность таких систем, а отсутствие делает невозможным их созда- 
ние и развитие®. 

Основные массивы метаданных российских научных публика- 
ций агрегируются в системе РИНЦ, доступ к который открыт про- 
граммным агентам только на коммерческой основе. Кроме РИНЦ, 
эти данные могут поступать в один из центров регистрации иденти- 
фикаторов ОО! (как правило, это система Сго$5геР). Однако зачастую 
редакции журналов передают информацию несвоевременно, с не- 
соблюдением части требований к размещаемой информации. 

2. Доступ к полным текстам публикаций затруднен. Развитие па- 
радигмы Ра*а-Риуеп 5$<епсе основано и реализуемо только при ус- 
ловии открытости научной информации и унификации протоколов 
доступа к ней для потоковой машинной обработки. Однако сегодня 
открытые централизованные полнотекстовые архивы в России от- 
сутствуют за очень редкими исключениями (Сурейептка, Мапе®), 
более того, многие оттиски публикаций находятся в зашифрованном 
виде с запретом чтения и копирования. Электронно-библиотечные 
системы предоставляют лицензированный доступ к своим ресурсам 
и при этом сфокусированы на задаче книгообеспеченности образо- 
вательного процесса в вузах. 

В этом смысле агрегаторы научной информации (например, 
РИНЦ) могут обеспечивать не только пользовательский доступ к пу- 
бликациям в человеко-читаемом виде и стандартным метаданным 
(названия, авторы, даты), но и обеспечивать возможность их углу- 
бленной обработки через программные интерфейсы. 

3. Результаты научных экспериментов (в т. ч. дорогостоящих), 
на основании которых публикуются научные работы, остаются не- 
доступными. Во многих случаях они некоторое время хранятся на 
жестких дисках лабораторных компьютеров и затем часто про- 
падают. Из-за этого полученные результаты анализа невозможно 
проверить, а первичные данные — повторно использовать в других 


9 Метаданные — это данные о данных; информация о другой информации или дан- 
ные, относящиеся к дополнительной информации о содержимом или объекте. Напри- 
мер, метаданными статьи является ее название, наименование журнала, коды тема- 
тических классификаторов, ФИО авторов, места их работы и др. Метаданные имеют 
строгую структуру и позволяет обрабатывать объект, не извлекая его содержимое 
(например, не анализируя полный текст публикации). 

0 Гуськов А. Е., Косяков Д. В. С чего должна начинаться цифровизация российской 
науки? УВЕ: ВЕр$://тЧксатогги/питапКайап-5сепсе/5-спедо-4о|хПпа-пасНтайуа-с!- 
Номхас!уа-го$$И$Ко!-пачкК!.Пт (дата обращения: 07.07.2022). 
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исследованиях. Отметим, что в современной исследовательской 
культуре массивы данных уже стали самостоятельным видом публи- 
каций, издаваемых в специальных высокорейтинговых журналах, 
например, 5‹епИЯс Ра*а (Маиге РчБ!$Вта Сгочр), Ваёа ш ВиеЕ (Е!- 
земег). В России подобная практика отсутствует. 

4. Ряд профинансированных проектов в области развития науч- 
но-информационной инфраструктуры не дали ожидаемого эффек- 
та. В качестве некоторых примеров можно привести проект $еп- 
сер, который разрабатывается с 2017 г. и до сих пор не стал частью 
информационной инфраструктуры, а также государственные кон- 
курсы на создание тематических архивов в 2020 г., большинство из 
которых либо не работают, либо не используются. Причиной являет- 
ся недостаток механизмов поддержки уже начатых проектов, отсут- 
ствие «зонтичной» программы, которая бы «втягивала» в себя новые 
перспективные решения, интегрировала бы их в существующую ин- 
фраструктуру и оказывала содействие в их развитии. 

Эти проблемы ясно говорят о серьезных трудностях, возникаю- 
щих при создании высокотехнологичных информационных продук- 
тов на базе существующей в нынешнем виде отечественной инфра- 
структуры. В данном случае речь идет не только о коммерческих 
сервисах, но и об исследовательских платформенных решениях, во- 
круг которых формируются профессиональные сообщества пред- 
метных специалистов. 


Принципы разработки Стратегии развития Национальной науч- 
но-информационной инфраструктуры 

Необходимо отметить, что Национальная научно-информацион- 
ная инфраструктура является очень сложным объектом управления. 
Эта сложность обусловлена разнообразием акторов научно-инфор- 
мационной деятельности (поставщики и потребители научной ин- 
формации, ее систематизаторы, владельцы государственных и ком- 
мерческих информационных систем), видов научной информации 
(монографии, статьи, диссертации, патенты, отчеты, датасеты, моде- 
ли и др.), спецификой различных предметных областей и другими 
факторами. Перечисленные выше проблемы имеют системный ха- 
рактер, а значит, и их решение должно представлять собой комплекс 
системных изменений, затрагивающих значительную часть научного 
сообщества. Поэтому их последствия должны быть детально про- 
анализированы, а сами изменения должны сопровождаться разъ- 
яснительными мероприятиями и мерами, стимулирующими распро- 
странение новых практик. 

Другими словами, существуют принципиальные ограничения на 
возможность постепенной перестройки системы, особенно в ситуа- 
ции сильно ограниченного рынка научно-технической информации. 
Мы считаем, что в текущей ситуации введение новых принципов ор- 
ганизации комплекса научно-исследовательской информации не мо- 
жет быть отдано на откуп процессам самоорганизации и должно быть 
инициировано сверху. Причиной невозможности реализации ре- 
шения, основанного на самоорганизации, которое в любых других 
условиях было бы наиболее логичным и продуктивным, повторим, 
является практически полное отсутствие предпринимательской 
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инициативы в этой зоне деятельности и, соответственно, отсутствие 
рыночных агентов, способных на самоорганизацию. 

Решение обозначенных проблем должно начинаться с разра- 
ботки Стратегии развития Национальной научно-информационной 
инфраструктуры, в которой научным сообществом формулируется 
консенсус целей, задач и направлений ее развития. Создание Стра- 
тегии, отраженной в форме комплекса документов и разделяемой 
ключевыми акторами этой сферы, само по себе является сложной 
организационной задачей, успешное решение которой возможно 
лишь при соблюдении принципов коллегиальности, структурности 
и иерархии целеполагания, а также программного подхода. 

Коллегиальность. Основная сложность разработки Стратегии 
состоит в необходимости учитывать интересы большого числа раз- 
нородных участников информационного обмена: поставщиков, по- 
требителей, агрегаторов, систематизаторов, операторов государ- 
ственных информационных систем и регуляторов (подробнее о них 
будет сказано ниже), поэтому разработку Стратегии необходимо 
осуществлять на коллегиальной основе, привлекая представителей 
этих участников. Этот же механизм обеспечивает распространение 
положений Стратегии, ее понимание и принятие в научном сообще- 
стве. Несоблюдение принципа коллегиальности приведет к плохо 
продуманным или дискриминирующим решениям, делающим невоз- 
можным достижение стратегических целей. 

Структурность. Стратегия должна охватывать разные аспекты 
управления научной информацией, поэтому ее целесообразно раз- 
бить на два уровня. На 1-м уровне создается рамочный документ 
«Концепция Национальной научно-информационной инфраструк- 
туры», определяющий основные цели и задачи, принципы функ- 
ционирования и развития, ключевых участников и другие общие 
положения. На 2-м уровне, в соответствии с общей концепцией, раз- 
рабатываются стратегии по каждому из ключевых функциональных 
аспектов, таких как: 

1) управление российской научной информацией, включая си- 
стемы учета, хранения и распространения публикаций, форматов 
и протоколов обмена метаданными, политики развития открытых 
репозиториев и управления исследовательскими данными, вопросы 
развития основных видов научных публикаций, таких как моногра- 
фии и научная периодика; 

2) доступ к зарубежной научной информации, включая деклара- 
цию принципов и механизмов реализации национальной и централи- 
зованной подписки на полнотекстовые ресурсы, научно-информаци- 
онные предметные и аналитические базы данных, а также принципы 
участия в движении Ореп Ассе$$ и сопутствующие меры поддержки; 

3)развитие предметных онтологий, включая разработку сло- 
варей, тезаурусов, таксономий в различных предметных областях, 
формирование связей между ними, а также разработка механизмов 
их распространения и массового использования в процессах обме- 
на научной информацией. Разработка методов извлечения научных 
знаний, их сопоставления, обобщения и анализа; 

Д4)развитие рынка научно-информационных услуг, с учетом 
разных функциональных сегментов: поиск научной информации, 
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аналитика, создание предметных баз знаний, высокоинтеллектуаль- 
ные сервисы обработки научной информации и др. 

Этот список аспектов не является исчерпывающим. Более того, мо- 
жет оказаться целесообразным выделение 3-го уровня, где в рамках 
широких аспектов 2-го уровня будут сформулированы узкие страте- 
гии для более специфичных функциональных аспектов. К ним могут 
быть отнесены наиболее критичные или сложные вопросы научно-ин- 
формационной инфраструктуры, например, развитие научной периоди- 
ки, управление исследовательскими данными, создание научного задела 
для высокоинтеллектуальной обработки текстов на естественном языке. 

Иерархия целеполагания. Перечисленные выше стратегические 
документы должны определять цели, риски, возможности и ограни- 
чения для остальных проектов и программ, направленных на под- 
держку функционирования и развития Национальной научно-ин- 
формационной инфраструктуры. Это означает, что на их основе 
должны разрабатываться документы управления элементами на- 
учно-информационной инфраструктуры, в которых определяются 
конкретные механизмы реализации положений Стратегии (рис. 2). 
Например, к ним относятся: 

— программы развития институтов научной информации, науч- 
ных библиотек и других организаций, являющихся ключевыми участ- 
никами Национальной научно-информационной инфраструктуры; 

— технические задания на развитие государственных систем 
в области управления научной информацией; 

— конкурсная документация на выделение грантов для исследо- 
ваний в области развития методов искусственного интеллекта; 

— рекомендации по развитию научных журналов, научных изда- 
тельств и электронно-библиотечных систем; 

— рекомендации по управлению научной информацией для уни- 
верситетов и научных организаций; 

— профессиональный стандарт для обучения «инфодайверов» — 
современных специалистов в области поиска, извлечения и обра- 
ботки научной информации. 

Наконец, программный подход должен преобладать над проект- 
ным, поскольку целью реализации Стратегии является перестройка 
научно-информационной инфраструктуры с длительным горизонтом 
планирования. Практика показывает, что проектный подход несет 
в себе риски краткосрочности эффектов и исключение из фокуса 
внимания долгосрочных целей. Программный же подход обеспечи- 
вает лучшие условия для непрерывного и последовательного раз- 
вития инфраструктуры, увеличения и улучшения качества связей 
между ее элементами, а также создает среду и стимулы для появ- 
ления новых элементов и совершенствования уже существующих. 
Необходимо отметить, что он является приоритетным и не отменяет 
проектную деятельность, а определяет для нее рамки ограничений 
и возможностей. В дальнейшем мы будем называть комплекс меро- 
приятий по развитию Национальной научно-информационной ин- 
фраструктуры Программой. 
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Цели, задачи и барьеры развития Национальной научно-инфор- 
мационной инфраструктуры 

Авторы этой работы считают, что основной целью должно быть 
развитие инфраструктуры рынка научной информации в соответ- 
ствии с парадигмой Ва{а-Риуеп 5<епсе. Это означает, что Страте- 
гия должна быть направлена на запуск рыночных механизмов в этой 
сфере и самоорганизацию агентов разного типа — управленцев, 
предпринимателей, разработчиков, исследователей и т. д. На наш 
взгляд, реализация программы в рамках преимущественно бюд- 
жетного финансирования не приведет к появлению живой, гибкой 
и продуктивной системы поддержки Вафа-Оиуеп $<епсе в стране, 
в то время как инициация трансформации сверху вкупе с форми- 
рованием принципов и условий, обеспечивающих возникновение 
рынка и формирование в нем устойчиво растущей наукоемкой эко- 
номики, способны решить поставленную нами задачу. 

Фокусировка на новой парадигме создает стимул для развития 
цифровых инструментов и соответствующих компетенций иссле- 
дователей, что в конечном итоге повышает конкурентоспособность 
российской науки. Акцент на коммерческом сегменте будет способ- 
ствовать притоку инвестиций в эту сферу, стимулирующих появле- 
ние новых продуктов и повышающих устойчивость всей системы. 
При этом сама программа должна обеспечивать государственную 
поддержку развития нижнего уровня инфраструктуры, на котором 
обеспечивается создание и распространение научной информации. 
Это необходимое условие, поскольку, во-первых, основная часть на- 
учной информации в России создается в государственных организа- 
циях преимущественно с бюджетным финансированием, а во-вторых, 
без необходимых для трансформации государственных инвестиций 
и прозрачной научно-информационной политики коммерческие ком- 
пании едва ли будут активно вкладываться в это направление. 

При этом инфраструктура должна быть принципиально откры- 
той для других, наиболее продуктивных и активных акторов науч- 
но-исследовательского профиля — Впр центров частных компаний, 
свободных ученых, а также тех позиций, которые традиционно не 
рассматривались в качестве создателей научного знания — пред- 
принимателей, производственников, разработчиков, представите- 
лей свободных творческих профессий, педагогов и других позиций, 
чье функционирование связано с созданием или потреблением на- 
учных знаний. Критически важно как можно раньше сделать инфра- 
структуру доступной для ученых и предпринимателей из других 
стран, так ее мощность и продуктивность будет значительно повы- 
шена, и у страны появится принципиальная возможность создания 
нового сектора глобально-конкурентной экономики. 

Для достижения этой цели мы выделили $ ключевые задачи и со- 
ответствующие им барьеры, которые придется преодолевать. 

Задача 1. Создание распределенной инфраструктуры для сбора, 
хранения, обработки и распространения обмена и доступа к мас- 
сивам научной информации в машиночитаемой форме. Эта зада- 
ча включает создание и развитие научно-информационных систем, 
обеспечивающих сбор, хранение, обработку и распространение 
различных видов и форм научных данных, разработку и внедрение 
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необходимых для этого стандартов и протоколов, создание про- 
граммных интерфейсов (АР!) для «цифровых агентов». 

Для решения этой задачи необходимо преодоление следующих 
организационных и технических барьеров. 

1. Большой объем существующих и новых научных данных соз- 
дает сильный инерционный фактор и не позволяет оперативно вно- 
сить изменения во все элементы инфраструктуры. 

2. Организационная разобщенность владельцев научных данных 
делает невозможным формирование прямых контуров управления 
инфраструктурой. 

5. «Монополия» на данные, когда владельцы научной информа- 
ции не заинтересованы в ее распространении, требует введения 
сложной системы мотивации для внедрения изменений. 

4. Российские издатели преимущественно ориентированы на по- 
требление научного контента людьми, а не программами. 

5. Недостаточно массовое использование стандартных фор- 
матов представления данных и схем идентификации информаци- 
онных сущностей (публикаций, людей, организаций, проектов), 
В Т. Ч. Из-за их отсутствия или незнания специалистов об их суще- 
ствовании, значительно затрудняют связывание данных из различ- 
ных источников. 

Задача 2. Создание научного задела для разработки высокотех- 
нологичных продуктов. Эта задача подразумевает стимулирование 
научных проектов в области развития методов анализа текстов на 
естественных языках (МЕР, Ма{ига! Гапдцаае Ргосез$та) с целью 
извлечения знаний, методов сбора, систематизации и управления 
знаниями, включая методы искусственного интеллекта и обработ- 
ки больших данных. Для стимулирования таких проектов целесо- 
образно выделить отдельную исследовательскую программу на базе 
профильных научных организаций и университетов, а также прово- 
дить конкурсы по выделению грантов на инициативные исследования 
в этой области. 

Эта задача нацелена на получение результатов в области 
т. н. фронтиров — тематик исследований, которые находятся на пе- 
редовом крае мировой научной мысли. Поэтому барьеры для этой 
задачи имеют научно-технологический характер. 

1. Высокая сложность задачи извлечения знаний из данных и тек- 
стов не позволяет рассчитывать на получение быстрых и качествен- 
ных решений. Первые прототипы будут иметь низкую точность и эф- 
фективность, которые со временем будут повышаться. 

2. Различные школы и подходы к систематизации знаний затруд- 
няют совместное использование этих результатов. Необходимо 
предпринимать особые усилия для синхронизации этой деятельно- 
СТИ, а также для разработки конвертеров знаний между различными 
системами, форматами и онтологическими моделями. 

Задача 3. Создание системы мотивации для всех пользователей 
инфраструктуры. Эта задача направлена на развитие рынка науч- 
но-информационных услуг. Для ее решения необходимы изучение 
явных и скрытых потребностей потребителей научной информа- 
ции, оценка потенциала российского сегмента рынка и поиск ниш 
на мировом рынке научной информации. Можно сказать, что суть 
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этой задачи состоит в таком изменении системы разделения труда 
ученых, при котором часть функций, связанных со сбором, анализом 
и управлением научной информацией, передается от исследователя 
к цифровым помощникам, которые рано или поздно смогут выпол- 
нять эти функции и быстрее, и дешевле, и, возможно, качественнее. 

К основным барьерам для этой задачи следует отнести следующие: 

1) сложившаяся во многих российских научных организациях 
система разделения труда ученых, которая сформировалась еще 
в прошлом веке и с тех пор почти не менялась, слабо ориентирова- 
на на адаптацию к парадигме Ваёа-Оиуеп 5<епсе и использование 
информационных продуктов нового поколения; 

2) неразвитость российского рынка научно-информационных ус- 
луг ограничивает рост исследовательской культуры и притупляет 
информационные потребности ученых; 

3) недостаток в научном секторе квалифицированных специали- 
стов в области работы с научной информацией (да и в области ин- 
формационных технологий вообще) ограничивает проникновение 
новых продуктов в исследовательские институты и университеты. 


Национальная инфраструктура как среда для приращения цен- 
ности научной информации 

Поясним суть 1-й и 2-й задач с помощью процесса приращения 
ценности научной информации. На рис. 3 изображены 4 уровня цен- 
ности научной информации с точки зрения использующих ее про- 
дуктов. Если на нижнем уровне эта ценность состоит лишь в том, что 
отдельно взятая публикация может быть кем-то получена и прочи- 
тана, то на 2-м уровне подобные публикации с помощью каталогов 
уже формируют организованное информационное пространство, 
в котором значительно упрощается их поиск и разные виды пото- 
ковой обработки. На 5-м уровне на основе извлеченных из публи- 
каций данных формируются базы знаний — продукты, ключевым 
свойством которых является возможность машинного «понимания» 
И «оперирования» знаниями, представленными некоторым форма- 
лизованным способом. На самом высокотехнологичном, 4-м, уровне 
создаются интеллектуальные программные сервисы, которые могут 
не только анализировать и обобщать имеющиеся формализованные 
знания, но и порождать новые, производные от них. 

Необходимо отдельно отметить иерархичность представленных 
уровней приращения ценности научной информации. Во-первых, 
уровниТи 2 соответствуют описанной выше задаче 1, а уровни Зи 4 — 
задаче 2. Во-вторых, нижестоящие уровни не только предоставляют 
пользователям набор самостоятельных продуктов, но и формируют 
из них функциональную основу для продуктов вышестоящих уров- 
ней. Продукты верхних уровней используют эту основу, к которой 
применяют новые методы сбора, структуризации, извлечения, обо- 
гащения или анализа научного знания, что обеспечивает решение 
все более трудных задач. 

Ценность решения этих задач состоит в том, что трудозатраты 
исследователей на работу с научной информацией сокращаются за 
счет частичного или полного делегирования этих задач «цифровым 
помощникам». Действительно, на 1-м уровне все задачи выполняет 
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сам исследователь, а возможности для автоматизации отсутствуют 
или очень скупы. На 2-м уровне программные агенты получают воз- 
можность работать с каталогами научных публикаций, в значитель- 
ной степени сокращая для ученых время на поиск и выборку нуж- 
ных им работ. На 3-м уровне «машины» помогают исследователям 
«читать»: анализируют наборы данных, модели, методы и другие эле- 
менты, выявляют ключевые сущности (материалы, реактивы, препа- 
раты, оборудование), основные тезисы и извлекают их содержание 
в виде формализованных моделей. Эти модели используются на 4-м 
уровне, где на их основе интеллектуальные сервисы помогают уче- 
ным создавать производные знания. 

Таким образом, основной миссией Программы является созда- 
ние «питательной среды» для формирования цепочек приращения 
ценности научной информации, результатом чего будут являться 
высокоинтеллектуальные сервисы для информационной поддерж- 
ки различных видов научной деятельности. Как уже говорилось, их 
массовое появление и успешное развитие как продуктов возможно 
лишь в условиях рынка с хорошо выраженным спросом. Какого рода 
продукты это могут быть? 

Приведем здесь пример принципиальной архитектуры и ориенти- 
ровочный сценарий работы научно-информационного сервиса ново- 
го поколения «Навигатор для планирования исследований» (рис. 4), 
появление которого в той или иной реализации представляется 
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неизбежным на горизонте 5—10 лет как минимум в области есте- 
ственных и медицинских наук, после чего эти принципы будут реа- 
лизованы на более широком дисциплинарном спектре. 

В начале работы исследователь конфигурирует требования к ра- 
боте агента в соответствии с масштабом своей научной задачи, опи- 
сывая спецификацию одного или нескольких исследовательских 
вопросов, сформулированных в его проекте, или обозначая те ха- 
рактеристики будущего исследования, которые задают рамки ра- 
боты программного агента — например, методы, применимость, 
ограничения оборудования и ресурсов, требования к глубине кол- 
лаборации, дисциплинарный набор. Чем уже эти рамки, тем меньше 
потенциально интересных направлений исследований будет найде- 
но, но тем проще и быстрее будет выполнена работа. В зависимости 
от исходной конфигурации могут выполняться задачи от поиска аль- 
тернативных экспериментальных моделей или материалов под уже 
определенное исследование вплоть до широкого поиска фронтиров 
с высоким теоретическим или практическим потенциалом в широ- 
ком междисциплинарном поле. 

Навигатор обращается во внешние источники данных и собирает 
из них научную информацию, которая может быть релевантна для 
этой задачи: статьи, патенты, датасеты и др. Затем из этой инфор- 
мации Навигатор извлекает элементы знаний и связи между ними: 
объекты исследований и их свойства, методы, модели и др. При ра- 
боте в разных дисциплинарных доменах агент строит собственную 
онтологическую карту проблемной области, указывая на совпаде- 
ния и различия в теоретических основаниях, стоящих за экспери- 
ментальными моделями, и предлагает исследователю выбрать тот 
или иной набор теоретических и методологических оснований или 
помогает ему сконфигурировать новую онтологию и, таким образом, 
новый объект исследований. 

С помощью построенной таким образом онтологической модели 
Навигатор формирует варианты планов исследований с указанием 
необходимых условий, например наличия определенного оборудо- 
вания и реактивов. Кроме того, Навигатор указывает на необходи- 
мые коррекции в онтологических и методологических основаниях 
исследования, которые делают возможным привлечение датасетов, 
экспериментального дизайна или понятийного ряда из смежных 
или даже далеких дисциплин. 

Для каждого элемента плана приводится обоснование его вклю- 
чения в план с указанием источников, на основании которых это 
решение было предложено. Исследователь, исходя из имеющихся 
в его распоряжении возможностей, выбирает соответствующий план 
и запускает исследовательский процесс. Данный пример не описы- 
вает полный цикл исследования, и по этой причине мы не рассма- 
триваем то, как организован экспериментальный и вычислительный 
этапы исследовательской работы. Достаточно сказать, что эти этапы 
также должны быть оснащены соответствующим инструментарием, 
который позволит использовать их результаты в последующей рабо- 
те этой или любой другой исследовательской группы. К таким инстру- 
ментам относятся, например, системы цифровых лабораторных жур- 
налов и другие системы, обеспечивающие интеграцию лаборатории 
в цифровую инфраструктуру четвертой парадигмы науки. 
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Другим примером продуктов нового поколения является сервис 
подготовки научных обзоров, который находит публикации по за- 
данной тематике за определенный период времени, анализирует их 
содержимое, производит обобщение и формирует текст обзора пу- 
бликаций. Отметим, что этот текст будет не полноценной статьей, 
а, скорее, «полуфабрикатом» для локального применения. Чаще всего 
он будет использоваться для быстрого ознакомления исследователей 
с последними результатами, полученными другими научными группа- 
ми. Вместо изучения десятков и сотен статей достаточно будет озна- 
комиться с одним обзором-«полуфабрикатом», выбрав на его основе 
несколько работ, которые ученому следует внимательно прочитать. 

Также обзор-«полуфабрикат» может выступить прообразом на- 
стоящего научного обзора, если группа исследователей использует 
его в качестве основы и доработает до полноценной публикации. 
Отметим, что по мере развития методов обработки текстов на есте- 
ственном языке его качество будет постепенно возрастать и требо- 
вать все меньше усилий по его доработке. Рано или поздно цифро- 
вой помощник самостоятельно сможет сгенерировать полноценный 
научный обзор, и это уже не является фантастикой — первая моно- 
графия о технологиях создания литий-ионных батареек, созданная 
программными алгоритмами, была издана в 2019 г. [4]. 

Может показаться, что в условиях развитой научно-информацион- 
ной инфраструктуры У экспертов в области научной информации ра- 
боты будет значительно меньше. Полагаем, что все будет ровно нао- 
борот — задач, связанных с обработкой научной информации, станет 
значительно больше, поскольку исследователям будет выгодно не 
тратить на это свое время, а воспользоваться высококвалифициро- 
ванным сервисом. При этом деятельность информационных специа- 
листов уже в меньшей степени будет рутинной (такие задачи будут 
выполняться программными средствами), а в большей — интеллекту- 
альной, включая совершенствование методов машинного обучения. 

В скором времени, вероятно, начнется процесс «уберизации» 
рынка услуг научной информации. Будут появляться «маркетплей- 
сы» научных инфосервисов, которые будут упрощать связывание 
поставщиков типовых услуг (отдельных информационных специа- 
листов и компании, которые специализируются в области обработки 
и анализа научной информации) и их потребителей (исследователь- 
ские группы, научные организации, университеты, инновационные 
компании). К таким типовым услугам уже сейчас можно отнести 
подбор публикаций по заданной тематике, подготовку систематиче- 
ских обзоров и мета-анализов, выполнение патентных исследований 
и подготовку заявок на охрану интеллектуальной собственности. 

Таким образом, современная научно-информационная инфра- 
структура не только улучшает качество научных результатов, но 
и способствует развитию рынка научных услуг, что, в свою очередь, 
ускоряет и удешевляет исследовательские проекты. 


Контуры системы управления 

Как уже отмечалось, основная сложность в управлении Про- 
граммой состоит в необходимости консолидации интересов и акту- 
ализации направлений деятельности большого числа разнородных 
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участников информационного обмена. Любой научный журнал или 
информационная система является частью этой инфраструктуры, 
а любой исследователь (и не только исследователь) — ее пользо- 
вателем. Выделим следующие категории акторов инфраструктуры: 

1) поставщики ресурсов и услуг: научные издатели, университе- 
ты, научные организации; 

2) потребители ресурсов и услуг: профессиональные сообще- 
ства исследователей, экспертные советы, университеты, научные 
организации, корпоративные К&0О центры; 

3) агрегаторы научной информации: РИНЦ, электронно-библио- 
течные системы, открытые архивы; 

4) систематизаторы научной информации: институты научной ин- 
формации, научные и научно-технические библиотеки; 

5) операторы государственных информационных систем: Центр ин- 
формационных технологий и систем органов исполнительной власти, 
Всероссийская аттестационная комиссия, Федеральный институт про- 
мышленной собственности, Российский научно-исследовательский 
институт экономики, политики и права в научно-технической сфере; 

6) государственные регуляторы — федеральные органы испол- 
нительной власти, чья деятельность существенно влияет на сферу 
научной-информации, например Минобрнауки России, Минцифры 
России, Минздрав России, Роспатент. 

Поставщиками и потребителями научной информации только 
в России являются более 1 ООО организаций. При этом значимые 
роли играют не только органы государственной власти и бюджет- 
ные учреждения, но и коммерческие, и некоммерческие организа- 
ции. Для управления подобными сложными системами практикуется 
создание специального Консорциума, основными задачами которо- 
го являются (рис. 5): 

1) разработка и актуализация Стратегии развития Национальной 
научно-информационной инфраструктуры; 

2) планирование и контроль выполнения работ по реализации 
Стратегии; 

3) координация деятельности ключевых участников Программы, 
к которым прежде всего относятся систематизаторы и агрегаторы 
научной информации, а также операторы государственных инфор- 
мационных систем; 

4) содействие внедрению новых инфраструктурных и продукто- 
вых ИТ-решений; 

5) разработка и экспертиза нормативных документов, регулиру- 
ющих деятельность в научно-информационной сфере, а также реко- 
мендаций для увеличения ее эффективности; 

6) распространение лучших методов и практик работы с научной 
информацией. 

Для сбалансированной работы в состав Консорциума должны 
войти государственные регуляторы, Российская академия наук, 
ключевые участники, наиболее крупные поставщики научной ин- 
формации и некоторые профессиональные научные сообщества. 
В деятельности Консорциума следует выделить предметные группы, 
в которых подготавливаются решения, специфичные для отдельных 
областей наук, а также 2 Совета. 
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1. Координационный совет, отвечающий за координацию деятель- 
ности акторов, взаимодействие с органами государственной власти, 
разработку нормативных документов и принятие стратегических 
решений. 

2. Технологический совет, отвечающий за разработку, развитие 
и поддержку инфраструктурных ИТ-решений (информационных ре- 
сурсов, систем и сервисов), разработку протоколов хранения и об- 
мена научными данными, программных интерфейсов и рекоменда- 
ций по их использованию. 

Финансовую модель управления Программой еще предстоит раз- 
работать, но уже сейчас можно предположить, что она не потребует 
значительных дополнительных средств из бюджета страны. Многие 
вопросы лежат в организационной плоскости, после решения ко- 
торых уже имеющееся финансирование может быть использовано 
в целях Программы гораздо более эффективно. 

Также могут быть целевым образом привлечены иные источники. 
Например, в сотрудничестве с Российским научным фондом может 
быть объявлен конкурс научных грантов на исследования, ориен- 
тированные на развитие методов искусственного интеллекта в за- 
дачах обработки научной информации. Российский фонд развития 
информационных технологий может предоставить целевые гранты 
на разработку новых инфраструктурных ИТ-решений. Российский 
фонд фундаментальных исследований в настоящее время преобра- 
зуется в Российский центр научной информации, после чего также 
займет свою функциональную нишу в этой инфраструктуре. 

Одной из метрик эффективности программы станет производи- 
тельность труда, что подразумевает не повышение, а снижение ин- 
формационной нагрузки на работника. При этом мы понимаем, что 
любой переход на новые инструменты приводит к временному паде- 
нию производительности труда в момент перехода — этот факт из- 
вестен из опыта компаний, проводящих автоматизацию производств 
и коммерческих компаний. Эти метрики должны быть рассчитаны за- 
ранее, а программа должна реализовываться в тесной связи с фак- 
тическими показателями по этой и другим, не менее важным метри- 
кам продуктивности. 

Помня о традиционных страхах научного сообщества, необходи- 
мо отметить, что основная миссия Консорциума — эволюционный 
путь развития, а никак не «сломать и заново построить» (револю- 
ЦИЯ) ИЛИ «зарегулировать» обмен научной информацией (бюрокра- 
тизация). Деятельность Консорциума должна быть прежде всего 
направлена на увеличение количества и качества научной инфор- 
мации, расширение возможностей ее использования (включая ма- 
шинную обработку), создание условий для развития рынка научной 
информации и разработку необходимых для этого ИТ-решений. 


Заключение / Сопс!и$юп 
Развитие Национальной научно-информационной инфраструкту- 


ры является очень сложной и масштабной задачей в качестве от- 
вета на вызовы, связанные с новой парадигмой исследовательской 
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деятельности Ра{а-ОФимуеп 5<епсе, с учетом исторически сложив- 
шихся в России проблем в сфере научных коммуникаций. Эта Про- 
грамма должна основываться на Стратегии, разработка которой 
выполняется с учетом принципов коллегиальности, структурности, 
иерархии целеполагания и программного подхода. Ее целью должно 
быть развитие инфраструктуры рынка научной информации в соот- 
ветствии с парадигмой Ва{а-Оиуеп $сепсе, а основной миссией — 
создание «питательной среды» для формирования цепочек прира- 
щения ценности научной информации. 

Результатом Программы должны стать новые высокоинтеллекту- 
альные сервисы для информационной поддержки различных видов 
научной деятельности; развитие цифровых компетенций исследо- 
вателей; значительное увеличение интенсивности использования 
научного контента; развитие рынка научно-информационных услуг; 
улучшения в системе разделения научного труда. Все это позволит 
университетам и научным организациям более интенсивно накапли- 
вать и использовать цифровой капитал [5], который уже не просто 
играет значимую роль в научно-технологическом развитии, а опре- 
деляет конкурентоспособность субъектов этого процесса. 

В заключение отметим, что при реализации такой масштабной Про- 
граммы следует соблюдать принцип «поедания слона по кусочкам». 
Поскольку этот «слон» действительно большой, придется применять 
и комбинировать различные способы его «нарезки», такие как: 

. по функциональным аспектам; 

. по задачам и уровням ценности научной информации; 

. по видам и источникам публикаций; 

» по категориям акторов научно-информационной инфраструктуры; 

. по преодолеваемым барьерам. 

Однако нужно ли вообще начинать эту долгую «трапезу»? Или, 
может быть, лучше оставить все как есть? Отвечая на этот вопрос, 
можно провести аналогию между информационной инфраструкту- 
рой науки и транспортной инфраструктурой региона. 

Если в регионе плохие дороги, неудобный общественный транс- 
порт, неразвитое железнодорожное и авиасообщение, то жизнь от 
этого не остановится. Люди все равно будут перемещаться, грузы — 
доставляться, а бизнес — функционировать. Но это будет сопрово- 
ждаться постоянными потерями времени и дополнительными рас- 
ходами, что будет демотивировать пользователей инфраструктуры 
(никто не хочет лишний раз ехать по плохой дороге, а потом ремонти- 
ровать машину). Качество жизни в регионе будет оставаться низким, 
а туристическая и инвестиционная привлекательность — слабой. 

Потери от плохой инфраструктуры могут быть очень большими, 
но при этом они часто оказываются недооцененными, поскольку эти 
потери очень трудно измерить из-за отсутствия базы для сравнения. 
Есть и множество примеров, когда вокруг новой инфраструктуры, 
отвечающей всем современным требованиям, выстраиваются целые 
города и экосистемы. 

Аналогия с транспортной инфраструктурой здесь неслучайна. 
Научно-информационная инфраструктура в определенном смысле 
прокладывает «дороги» между «городами» исследователей, способ- 
ствуя быстрой и качественной доставке основной ценности этого 
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«мира» — научного знания. В настоящее время наблюдается все 
больше признаков того, что сложившаяся инфраструктура «ветша- 
ет» и перестает соответствовать современным требованиям, кото- 
рые к тому же резко возросли. На фоне других вызовов перед оте- 
чественной наукой эта проблема может казаться не столь значимой, 
однако без ее решения ответы на эти вызовы, скорее всего, окажут- 
ся неэффективными. 

Для реализации Программы необходимо создание управляющего 
органа, который будет заниматься разработкой Стратегии, контро- 
лем соблюдения ее положений, согласованием требований держа- 
телей научно-исследовательской инфраструктуры, исследователей, 
предпринимателей; разработкой, а также координацией их деятель- 
ности. Это чрезвычайно трудная работа, требующая филигранной 
синхронизации требований, очень различающихся между собой по 
характеру деятельности субъектов. Сложность этой программы со- 
поставима с крупными национальными проектами вроде организа- 
ции Олимпиады 2014 г. и трансформации энергетического рынка РФ 
РАО ЕЭС, но у нас просто нет другого выхода, если мы рассчитываем 
на то, что Россия удержит свои позиции в мире в качестве научной 
державы во время и после находящейся в разгаре научной и про- 
мышленной революции. 
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Авторы заявляют об отсутствии конфликта интересов. 
ТВе ащрог$ аес1аге по соп с о! т\еге$%$. 
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